
ICLR 2024|把图像视为外语,快手、北大多模态大模型媲美DALLE-3
ICLR 2024|把图像视为外语,快手、北大多模态大模型媲美DALLE-3动态视觉分词统一图文表示,快手与北大合作提出基座模型 LaVIT 刷榜多模态理解与生成任务。
来自主题: AI技术研报
5172 点击 2024-01-30 13:36
动态视觉分词统一图文表示,快手与北大合作提出基座模型 LaVIT 刷榜多模态理解与生成任务。
ICLR 2024录用结果出来了。一年一度的ICLR顶会录用结果公布了!今年共7000多篇投稿论文,录用率31%。